其他
R语言 | 让统计更easy的easystats集合包
easystats 是 R 包集合,可提供统一且easy的代码进行 统计分析。
与 tidyverse 有何不同?
tidyverse包集合,是 R语言 中非常流行的软件包集合(ggplot、dplyr、tidyr......),它也使 R 的使用更加容易。那么,您应该选择 tidyverse 还是 easystats?
两个都选!
事实上,这两个生态系统的设计考虑了非常不同的目标。tidyverse 包主要用于 数据操作和探索
。而 easystats 更关注分析的最后阶段:理解和解释您的结果,并在手稿或报告中报告它们
。您绝对可以在 tidyverse 工作流程中使用 easystats 功能!
easystats + tidyverse = ❤️
easystats生态圈
每个 easystats 包都有不同的范围和用途。这意味着您最好的开始方式是探索并选择您认为可能对您有用的那些。但是,由于它们的构建考虑了"更大的图景",您会意识到使用更多它们会创建一个流畅的工作流程,因为这些包旨在协同工作。理想情况下,这些软件包可以协同工作,涵盖统计分析和数据可视化的所有方面。
report:📜 🎉 生成自动统计报告 correlation:🔗 相关性的多合一包 modelbased:📈 基于统计模型估计效果、组平均值和组间对比 bayestestR:👻 非常适合贝叶斯统计的初学者或专家 effectize: 🐉 计算、转换、解释和使用效果大小和标准化参数的索引 see :🎨 创建漂亮结果可视化的绘图 parameters:📊 获取有关模型包含参数所有信息的表格 performance:💪模型的质量和性能指标(R2、ICC、LOO、AIC、BF、...) insight:🔮 对于开发人员来说,一个包可以帮助您使用不同的模型和包 datawizard:🧙 清理和转换数据的魔法药水
截止2022-09-21, easystats生态中各个包的下载情况
Total | insight | bayestestR | parameters | performance | datawizard | effectsize | correlation | see | modelbased | report | easystats |
---|---|---|---|---|---|---|---|---|---|---|---|
10,001,095 | 3,085,739 | 1,373,379 | 1,363,678 | 1,285,506 | 1,159,097 | 1,060,079 | 277,541 | 251,038 | 94,089 | 48,876 | 2,073 |
安装
install.packages("easystats")
炫一下
easystats到底如何好用,今天只实验report包,该包号称 “从 R 到你的手稿”
报告的主要目标是弥合 R 的输出与手稿中包含的格式化结果之间的差距。它根据最佳实践指南(例如 APA 期刊风格)自动生成模型和数据框架的报告,确保结果报告的标准化和质量。
生成iris数据集描述性统计信息的英文报告
report(iris)
Run
The data contains 150 observations of the following 5 variables:
- Sepal.Length: n = 150, Mean = 5.84, SD = 0.83, Median = 5.80, MAD = 1.04, range: [4.30, 7.90],
Skewness = 0.31, Kurtosis = -0.55, 0% missing
- Sepal.Width: n = 150, Mean = 3.06, SD = 0.44, Median = 3.00, MAD = 0.44, range: [2, 4.40], Skewness
= 0.32, Kurtosis = 0.23, 0% missing
- Petal.Length: n = 150, Mean = 3.76, SD = 1.77, Median = 4.35, MAD = 1.85, range: [1, 6.90],
Skewness = -0.27, Kurtosis = -1.40, 0% missing
- Petal.Width: n = 150, Mean = 1.20, SD = 0.76, Median = 1.30, MAD = 1.04, range: [0.10, 2.50],
Skewness = -0.10, Kurtosis = -1.34, 0% missing
- Species: 3 levels, namely setosa (n = 50, 33.33%), versicolor (n = 50, 33.33%) and virginica (n =
50, 33.33%)
生成线性回归模型的报告
library(report)
model <- lm(Sepal.Length ~ Species, data = iris)
report(model)
Run
We fitted a linear model (estimated using OLS) to predict Sepal.Length with Species (formula:
Sepal.Length ~ Species). The model explains a statistically significant and substantial proportion of
variance (R2 = 0.62, F(2, 147) = 119.26, p < .001, adj. R2 = 0.61). The model's intercept,
corresponding to Species = setosa, is at 5.01 (95% CI [4.86, 5.15], t(147) = 68.76, p < .001). Within
this model:
- The effect of Species [versicolor] is statistically significant and positive (beta = 0.93, 95% CI
[0.73, 1.13], t(147) = 9.03, p < .001; Std. beta = 1.12, 95% CI [0.88, 1.37])
- The effect of Species [virginica] is statistically significant and positive (beta = 1.58, 95% CI
[1.38, 1.79], t(147) = 15.37, p < .001; Std. beta = 1.91, 95% CI [1.66, 2.16])
Standardized parameters were obtained by fitting the model on a standardized version of the dataset.
95% Confidence Intervals (CIs) and p-values were computed using a Wald t-distribution approximation.
更多内容请阅读 report包 的文档。